查看原文
其他

庄园教授:一种基于机器学习和样本差异的通用Wi-Fi指纹定位方法| SANA佳文速递

庄园 曹晓祥 卫星导航国际期刊 2023-01-11

标题:一种基于机器学习和样本差异的通用Wi-Fi指纹定位方法

作者:曹晓祥,庄园,杨先圣,孙骁,王轩

主题词指纹定位;样本差异;二分类;提升方法;机器学习;WiFi定位

(图片来自作者)


A universal Wi-Fi fingerprint localization method based on machine learning and sample differencesXiaoxiang Cao, Yuan Zhuang* , Xiansheng Yang, Xiao Sun and Xuan Wang

Satellite Navigation (2021) 2: 27

引用文章:

Cao, X. X., Zhuang, Y., Yang, X. S. et al. A universal Wi-Fi fingerprint localization method based on machine learning and sample differencesSatell Navig 2, 27 (2021). https://doi.org/10.1186/s43020-021-00058-8.

PDF文件下载链接:

https://satellite-navigation.springeropen.com/articles/10.1186/s43020-0‍21-00058-8

                      -长按识别二维码查看/下载全文-


Editorial Summary

WiFi:Fingerprint-based Positioning Using Machine Learning

The Wi-Fi fingerprint-based positioning is widely used because of its ready hardware and acceptable accuracy, especially using the Machine Learning (ML) and Deep Learning (DL). The authors deeply studied for solving two majorproblems:

1. The traditional ML-based method faces the problem of small sample learning and small number of features, we use the differences between samples to calculate new classification features, and use the binary classification algorithm to replace the multi-classification algorithm.

2. The proposed method greatly improves the model’s scene adaptability, the model trained by one building’s data can be well applied to another building, which shows strong generalizable ability. It provides a new idea for the fingerprint-based positioing model’s deployment and the management on the cloud, especially when there are a large amount of classification models.





本文亮点

1.使用样本间差异组成新的分类特征,将原本指纹匹配定位中多分类问题转化成二分类问题,如此既解决了多分类中面临的小样本学习问题,又为分类模型注入更多有效的特征


2.使用基于样本差异训练而成的分类模型具备场景迁移能力,不同场景下训练的分类模型可以自由切换使用,传统的“一场景一模型”解决思路无法实现大规模的云端部署、应用,本文提出的通用模型为指纹匹配模型线上部署提供了新的思路



内容简介

Wi-Fi定位技术由于其低成本和不需要额外设备安装使得其成为室内定位技术研究中的热点。其中基于Wi-Fi的指纹定位由于其仅依赖于场景下已有的硬件,并且其精度也较为可观,因此而得到广泛应用,特别是目前基于机器学习(ML)和深度学习(DL)的指纹定位算法。然而,此类方法存在两个较大的挑战。一是传统的ML方法需要为每个场景训练一个特定的分类模型,这就为其云上部署和管理带来了难度。二是利用少量的指纹样本很难训练出有效的多分类模型。
针对这两个问题,本文提出了一种基于样本差异的二分类模型。根据原始指纹点间距离,将原始指纹对分为正样本和负样本。引入新的相对特征(如排序特征)来取代传统的使用MAC地址和接收信号强度(RSS)的特征。最后,利用boosting算法对分类模型进行训练
使用来自三个不同建筑的UJIndoorLoc公开数据集来评估我们提出的方法。初步结果表明,该方法的楼层识别准确率可达99.54% (Extreme Gradient boosting, XGBoost)99.22%(Gradient boosting Decision Tree, GBDT),定位误差可达3.460m (XGBoost)4.022m(GBDT)该算法的另一个重要优点是,通过一个建筑物的数据训练出来的模型可以很好地应用于另一个建筑物,该模型具有很强的泛化、迁移能力


           图文导读 

I.同现有方法的比较

由于UJIndoorLoc数据集被广泛用于测试指纹定位算法的性能,因此本文方法的结果与其他论文方法的结果进行了对比,如表1所示。从表中可以看出,本文提出的新方法不仅在定位误差方面有较好的表现,而且在建筑物和楼层判断准确率方面也有较好的表现。第一种方法采用XGBoost,平均定位误差为3.42m,楼层判断准确率高达99.40%。第二种方法采用GBDT,平均定位误差为2.45m,楼层判断准确率为99.14%
表 1 其他论文结果同本文方法的比较


II.同传统方法的性能比较

评估指标主要有三个:楼层判断准确率、点位识别准确率和平均定位误差。本文将多分类问题转化为二分类,树模型在二分类中表现良好。因此,本文选择决策树和集成学习算法EL(包括bagging算法和boosting算法)分别来评价所提方法的性能。bagging算法包括baggingRFboosting算法包括XGBoostGBDT

具体结果如表2所示。很明显,DT性能比EL差得多。bagging算法的性能较boosting算法差。如表2所示,使用GBDT时定位精度略高。然而,XGBoost在楼层判断上表现更好。1为不同算法的CDF

表 2 当训练数据和验证数据来自同一建筑物时,不同方法的性能比较


图 1 不同方法的CDF



III.不同建筑物训练模型性能比较

本文方法的主要目的是提高分类器的适应能力,使一个建筑训练的分类器可以在另一个建筑中使用。利用三座不同建筑物的测试数据验证了该方法的有效性下表记录了楼层判断准确率和点位识别准确率,以及平均定位误差。分别对DT算法、bagging算法和boosting算法的性能进行了测试。很明显本文方法优于其他方法,即使数据来自不同的建筑物,该方法仍表现良好。345为各建筑的结果,图234为各方法的CDF

表 3 使用XGBoost时不同分类器和不同测试数据的结果

表 4 使用bagging算法时不同分类器和不同测试数据的结果


表 5 使用DT算法时不同分类器和不同测试数据的结果


图 建筑物0使用传统方法和本文提出方法的CDF图


图 筑物1使用传统方法和本文提出方法的CDF


图 建筑物2使用传统方法和本文提出方法的CDF



IV.删除评分低特征后的性能分析

选取了23个特征来测试测试本文提出方法。6和图8显示了使用23个特征训练的分类器的结果。为了测试特征对分类器性能,我们将特征的数量进一步增加至57个,表6显示了它的性能

表 6 使用 23个特征时XGBoostGBDT对测试数据的性能比较

当使用XGBoostGBDT时,训练后可输出每个特征的得分。为了提高分类器的准确率,图567给出了每个特征的评分,但其中不同分类器的低评分特征是不同的。因此,我们将一些常见的低评分特征删除。利用剩下的特征来训练新的分类器,并对新分类器的性能进行测试。
图 5 使用来自Building0的数据训练模型得到的每个特征的得分
图 6 使用来自Building1的数据训练模型得到的每个特征的得分


图 使用来自Building2的数据训练模型得到的每个特征的得分


表7显示了删除某些特性后的性能。我们发现在删除低评分的特征后,有效性并没有明显的提高。图8-9分别是不同建筑中各特征的得分。


表 7 删除低评分特征后使用XGBoostGBDT时不同测试样本的测试结果


图 使用部分特征时传统方法和本文提出方法的CDF



图 9 删除部分特征时传统方法和本文提出方法的CDF




作者简介


    庄园 教授

  本文通讯作者   武汉大学作者简介

庄园入选国家级人才计划青年项目,武汉大学测绘遥感信息工程国家重点实验室教授,博士生导师。2015年获加拿大卡尔加里大学博士,之后分别在加拿大、美国从事研发工作。主要研究方向涵盖多传感器融合定位、导航与感知,物联网、车联网传感器应用(识别、通信、定位与检测),低功耗定位导航芯片与终端。在IEEE COMST、TMC、IOTJ、TVT、TITS、TWC、TAES、JSSCC、AAAI、IJCAI等行业核心期刊和会议上发表论文80余篇,其中第一、通讯作者SCI期刊论文30余篇;谷歌学术引用2000余次,H-index指数25。担任IEEEIoT J.和Satell Navig专刊编辑,20+ SCI期刊审稿人。曾获ION GNSS+最佳论文奖、中国卫星导航年会最佳论文奖、IEEE世界室内定位竞赛手机组冠军等10余项学术奖励。开发的物联网定位与故障检测系统大规模使用在梅奥诊所、凯撒医疗、谷歌、思科等国际知名机构中。获批专利11项(含美国专利3项),转让3项核心专利及1项IP

中文主页(点击浏览):

http://jszy.whu.edu.cn/zhuangyuan/zh_CN/index.htm

Researchgate主页(点击浏览):

https://www.researchgate.net/profile/Yuan_Zhuang11


撰稿:曹晓祥

编辑:星航

审校:庄教授



推荐阅读

徐元博士:面向有色测量噪声下UWB/INS组合行人导航的分布式卡尔曼滤波| SANA佳文速递

[综述]| 面向室内的导航定位--现状和未来趋势| 李由

编委报告| 陈锐志:高精度室内定位技术及其应用

委报告| 牛小骥:从外在信号环境和内在感知能力看手机室内定位的可行性

重磅!SatNav“室内导航”专刊开始征文



       关于我们     


《卫星导航(英文)》(Satellite Navigation)创办于2020年,ESCI收录,是中国科学院空天信息创新研究院主办的英文学术期刊,主编是杨元喜院士,主要报道卫星导航相关的最新高水平科研成果与综述文章及通讯,在 Springer Nature开放获取(open access)出版。可免费获取全文,欢迎关注和投稿。

Website:http://satellite-navigation.springeropen.com/

E-mail:editorial_office@sana.org.cn/ satellite-navigation@aircas.ac.cn

Tel:86-10-58887063

           SANA 微信公众号

长按二维码关注我们





中国科学院空天信息创新研究院
期刊新媒体传播矩阵


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存